Google Gemini

Informations
Créateur	Google
Développé par	Google Brain et DeepMind
Première version	7 décembre 2023
État du projet	officiellement lancé le 7 décembre 2023, et encore en développement
Type	Famille de grands modèles de langage (d)
Licence	Licence propriétaire
Site web	deepmind.google/technologies/gemini

Google Gemini est une intelligence artificielle (IA), générative et multimodale, de type transformeur, créée par Google, annoncée lors de la conférence I/O destinée aux développeurs en juin 2023, puis présentée au public le 7 décembre 2023. Gemini signifie ici Generalized Multimodal Intelligence Network.

Ce grand modèle de langage (LLM) a été formé sur un ensemble massif de données de texte et d'images, entraîné sur les Tensor Processing Units (TPU) de Google.

Gemini peut comprendre et interagir avec l'audio et la vidéo, et générer du texte (poésie, scripts, pièces musicales, courriels, lettres, etc.), du code, des traductions (entre plus de 100 langues). Il peut produire plusieurs types de contenu créatif (images, dessins, sons, musique, vidéos...), aider des chercheurs en analysant des données ou en générant des hypothèses. Gemini peut répondre aux questions de manière informative ou en produisant des cours personnalisés, des jeux, des tutoriels..., avec les limites des IA (erreurs, biais, « hallucinations »...).

Selon Demis Hassabis, Gemini doit peu à peu pouvoir se connecter à des éléments robotiques, être doté d'un sens du toucher et de capacités à agir sur des actionneurs, tout en devenant plus précis et plus conscient du contexte et du monde^[1].

↑ ^{a b et c} Erreur de référence : Balise <ref> incorrecte : aucun texte n’a été fourni pour les références nommées BigData12Dec2023

[BigData12Dec2023-1] {a b et c} Erreur de référence : Balise <ref> incorrecte : aucun texte n’a été fourni pour les références nommées BigData12Dec2023

[1]